بهبود عملکرد عاملها در جامعه مصنوعی با استفاده از یادگیری تقویتی

Authors

  • آرش رحمان گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران[email protected]
  • امیر پویان خدابخشی گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران[email protected]
  • محسن روحانی گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران [email protected]
Abstract:

چکیده معمولاً در سیستم‌های چندعاملی، تعاملات بین عامل‌ها و تعاملات عامل‌ها با محیط، به صورت انتخاب و اجرای عمل‌هایی از بین مجموعه‌ای محدود از اَعمال مشخص توسط عامل‌ها حاصل می‌شود. بنابراین نوع و میزان پیچیدگی رفتارهای پیدایشی حاصل از این تعاملات نیز به نحوه اجرا و تعداد رفتارهای قابل اجرا توسط عامل‌ها وابسته است. در این پژوهش سعی شد با توسعه مدل کسب و انتقال تجربه و اضافه کردن قابلیت یادگیری به عامل‌ها، تاثیر یادگیری در بهبود رفتار عامل‌ها در انتخاب روش (راهبرد) های انتقال تجربه و در بهبود شاخص‌های رفاهی در جامعه مصنوعی مورد مطالعه قرار گیرد. روش یادگیری پیشنهاد شده در پژوهش برای افزایش دامنه توانایی‌های عامل‌ها، یادگیری تقویتی4 بود. با استفاده از این روش، عامل‌ها به مرور زمان یاد گرفتند که چگونه در مواجهه با شرایط مختلف محیطی، رفتارهای مناسب‌تری را انتخاب و اجرا کنند تا به اهداف فردی و اجتماعی نزدیک‌تر شوند. نتایج حاصل از شبیه‌سازی و انجام آزمایش‌ها نشان داد که اِعمال فرآیند یادگیری می‌تواند منجر به بهبود رفتار عامل‌ها و بهبود شاخص‌های رفاهی جامعه مصنوعی شود.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

بهبود عملکرد حمله در تیم ربات‌های فوتبالیست با استفاده از یادگیری تقویتی

به‌دلیل عدم امکان پیش‌بینی همه وضعیت‌های ممکن برای عامل‌ها در یک سیستم چندعامله‌ی پویا و گسترده، روش‌های یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عامل‌ها می‌باشد. فوتبال شبیه‌سازی شده ربات‌ها یک مسئله شناخته‌شده برای ارزیابی الگوریتم‌های یادگیری ماشین روی سیستم‌های چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتم‌های معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رب...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

full text

پیش‌بینی روند حرکتی قیمت سهام با استفاده از XCS مبتنی بر الگوریتم ژنتیک و یادگیری تقویتی

پیشرفت‌ها در حوزۀ هوش مصنوعی و یادگیری ماشین به‌خصوص درزمینۀ محاسبات تکاملی نه‌تنها ما را قادر به تجزیه‌وتحلیل مؤثرتر داده‌ها نموده است، بلکه این امکان را فراهم ساخته که از آن‌ها برای فهم هرگونه الگوی زیربنایی بازارهای مالی استفاده گردد. اقتصاددانان، آماردانان و مدرسان امور مالی همواره علاقه‌مند به توسعه و آزمایش مدل‌های رفتاری قیمت سهام بوده‌اند. XCS سامانه‌ای مرکب از الگوریتم ژنتیک و یادگیری ...

full text

تنظیم خودکار سختی بازی‌های توان‌بخشی با استفاده از روش یادگیری تقویتی چندتناوبی (یاقوت)

تحقیقات نشان داده است که طراحی فعالیت‌های توان‌بخشی در قالب بازی‌های جدی می‌تواند منجر به انگیزش بیش‌تر در بیماران شود. درجه سختی چنین بازی‌هایی معمولاً به‌صورت دستی توسط درمانگر تنظیم می‌شود. این در حالی است که بازی‌های توان‌بخشی خانگی نیاز به تنظیم خودکار درجه سختی متناسب با مهارت‌های بیماران دارند. این مقاله روشی برای تنظیم درجه سختی بازی‌های توان‌بخشی ارائه می‌کند که در آن سختی بازی به‌صورت ...

full text

تقریب تابع ارزش عمل با استفاده از شبکه توابع پایه شعاعی برای یادگیری تقویتی

مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 8  issue 29

pages  107- 125

publication date 2016-02-20

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023